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摘 要 : 


[ 目的 /意义 ] 以 我 国 图 情 领域 为 例 ,测量 论文 的 新 颖 性 和 传统 性 并 探究 其 对 论文 学 术 影 响 力 的 作用 进而 揭示 学 术 
创新 的 规律 。[ 方法/ 过程] 采用 基于 马尔 科 夫 链 蒙 特 卡 罗 (Markov chain Monte Carlo, MCMC) 的 方法 ,对 我 国 2000 
年 至 2019 年 20 年 间 在 中 文 社 会 科学 引文 索引 (CSSCI) 中 收录 的 图 书馆 学 情报 学 领域 的 70 207 篇 研究 论文 的 新 
颖 性 、 传 统 性 进行 测量 ,并 分 析 论 文 新 颖 性 和 传统 性 对 论文 学 科 影 响 力 的 作用 。[ 结果 /结论 ] 结果 显示 ,其 他 因素 
不 变 时 ,论文 新 颖 性 提高 1 个 单位 ,论文 成 为 高 被 引 论文 的 优势 比 增加 11% ,而 论文 传统 性 提高 1 个 单位 ,论文 成 
为 高 被 引 论文 的 优势 比 增加 33% 。 边 际 效应 分 析 显 示 , 同 时 具有 较 高 的 新 颖 性 和 传统 性 的 论文 较 之 于 其 他 类 型 
的 论文 具有 更 高 的 成 为 高 被 引 论文 的 可 能 性 。 此 外 , 随 着 时 间 推 移 ,新 颖 性 对 论文 成 为 高 被 引 论 文 概率 的 影响 逐 
渐 削 弱 ,而 传统 性 的 影响 逐渐 增强 。 同 时 ,作者 困 队 规模 对 于 论文 的 新 颖 性 存在 显著 影响 ,这 种 影响 随 着 时 间 的 
推移 而 增强 。 这 些 发 现 凸显 我 国 图 情 领域 守 正 创新 的 特点 ,为 理解 我 国 图 情 领域 的 学 术 创新 规律 提供 新 的 实证 
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基础 。 同 时 ,也 提出 一 种 不 同 于 传统 信息 计量 的 基于 贝 叶 斯 统计 的 新 方法 。 
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它 长 期 以 来 有 关 图 情 领域 创新 发 展 的 研究 聚焦 于 安 
观 膛 向 的 把 握 和 梳理 0" ,而 忽视 了 从 微观 上 探究 图 
情 领域 科研 人 员 的 学 术 创新 机 制 。 从 微观 机 制 来 看 ， 
通常 认为 ,学 术 创新 是 科研 人 员 创造 性 地 利用 已 有 知 
识 而 创造 新 知识 或 新 想法 的 过 程 ”“” 。 科 研 人 员 可 以 
选择 创造 新 颖 知识 以 使 新 的 研究 成 果 能 突破 已 有 研究 
成 果 , 而 使 其 具有 新 颖 性 ”中 。 同 时 ,科研 人 员 在 
学 术 创新 的 过 程 中 也 会 选择 创造 性 地 重组 已 有 知识 ， 
从 而 使 得 新 的 研究 成 果 更 好 继承 .整合 已 有 的 研究 成 
果 , 使 其 更 具 传统 性 ”2 。 国 外 的 研究 表明 ， 
一 项 具体 的 研究 成 果 通常 兼 具 新 颖 性 和 传统 性 ,但 二 
者 的 程度 可 能 不 尽 相 同 ;而 不 同 程度 的 新 颖 性 与 传统 
性 的 组 合 会 使 得 学 术 成 果 产 生 不 同 的 学 科 影响 
力 " 0。 因此 ,探究 图 情 领 域 学 术 创 新 规律 的 一 个 
核心 问题 是 图 情 领域 的 科研 人 员 如 何 利用 兼 具 新 颖 性 


和 传统 性 的 知识 产生 有 影响 力 的 创新 成 果 。 

虽然 这 一 问题 对 于 理解 图 情 领 域 的 创新 发 展 非常 
重要 ,但 一 直 以 来 缺乏 系统 的 实证 研究 。 而 国外 的 相 
关 研 究 尽 管 可 以 借鉴 ,但 不 同文 化 背景 ,学科 领域 下 ， 
学 术 创 新 的 微观 机 制 有 着 明显 差异 “  ”。 因 此 , 需 
要 系统 深入 研究 这 一 问题 才 有 助 于 全 面 系统 地 把 握 图 
情 领 域 创新 发 展 的 规律 。 为 此 ,笔者 以 2000 年 至 2019 
年 20 年 间 在 中 文 社 会 科学 引文 索引 (CSSCI) 中 收录 的 
我 国 图 书馆 学 情报 学 领域 的 70 207 篇 研究 论文 为 研 
究 对 象 ,采用 基于 马尔 科 夫 链 蒙 特 卡 罗 (MCMC ) 的 方 
法 测量 这 些 论文 的 新 前 性 和 传统 性 ,并 分 析 论 文 新 笑 
性 和 传统 性 对 论文 学 科 影 响 力 的 作用 及 其 随时 间 的 变 
化 趋势 。 此 外 ,笔者 还 进一步 从 作者 团队 的 角度 探究 
论文 的 新 疾 性 和 传统 性 形成 的 微观 机 制 ,为 全 面 理解 
图 情 领域 学 术 创新 的 微观 机 制 提供 实证 支持 。 
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生 的 分 析 [J]. 图 书 情报 工作 ,2022 ,66(20) :148 - 161. 


2 研究 假设 


21 ”研究 成 果 新 颖 性 、 传 统 性 与 其 学 术 影 响 力 的 关系 

新 颖 性 是 学 术 成 果 的 重要 属性 。 通 常 认为 ,新 颖 
性 是 相对 的 ,是 相 较 于 一 定 标准 而 言 更 为 罕见 的 内 
容 " -590。 这 里 的 “一 定 标准 ”, 可 以 是 某 一 学 科 已 
A f RAP ,也 可 以 是 一 个 时 代 的 知识 体系 。 例 
如 ,用 先进 的 算法 进行 数据 分 析 和 挖掘 在 图 情 领 域 已 
经 不 具有 新 颖 性 ,但 在 其 他 一 些 学 科 中 可 能 依然 非常 
新 颖 。 新 颖 性 强 的 研究 成 果 往往 需要 研究 者 通过 其 创 
造 力 产生 具有 创新 性 甚至 突破 性 的 新 思想 或 新 见解 ， 
如 新 理论 .新 研究 方法 .新 研究 主题 等 "“”") 。 这 些 新 
思想 或 新 见解 往往 能 启发 相关 领域 的 研究 者 ,进而 产 
省 更 强 的 学 科 影响 力 ”” 。B，Uzzi 等 对 Web of Sci- 
en@ 中 来 自 不 同 领 域 的 1 790 万 篇 论文 的 分 析 发 现 ， 
在 控制 一 些 相 关 因 素 后 ,新 颖 性 高 的 论文 成 为 高 被 引 
论说 的 概率 明显 要 高 ”。 后 续 针对 其 他 类 型 的 英文 研 
究 甬 果 的 新 颖 性 开展 的 研究 均 得 出 基本 一 致 的 


-上 >AE[14-18] 
结论 o 


本 新颖 性 的 这 一 作用 在 我 国 图 情 领 域 的 研究 中 也 有 
脏 作 现 。 例 如 ,我 国 图 书馆 学 基础 理论 发 展 的 早期 ,不 
汉 禹 影响 力 的 理论 都 是 本 土 化 理论 ,是 结合 我 国 实际 
发 蝴 和 扬弃 西方 图 书馆 学 理论 而 形成 ,具有 明显 的 新 
BUE ;在 信息 技术 发 展 变革 时 期 ,数字 图 书馆 、 智 慧 
图 届 馆 等 新 概念 .新 理念 出 现 后 就 得 到 学 界 大 量 的 关 
注 @ 淖 继 成 为 研究 前 沿 " ,而 与 之 呼应 的 新 出 现 的 知 
识 服务 .智慧 服务 等 也 成 为 研究 热点 ,在 学 界 产生 了 广 
泛 的 影响 2 。 据 此 ,得 出 如 下 假设 ; 

假设 1: 图 情 领域 的 研究 论文 ,新 颖 性 越 强 ,学 科 
影响 力 越 大 。 

尽管 新 颖 性 体现 了 科研 中 的 创造 性 ,但 不 少 研究 
指出 ,对 于 科研 人 员 而 言 , 新 颖 性 会 是 一 把 双 刃 剑 P; 。 
一 方面 ,追求 新 颖 性 会 增加 学 术 研 究 的 不 确定 性 ,可 能 
会 导致 研究 者 生产 力 的 降低 和 研究 周期 的 增长 2 ; 
另 一 方面 , 受 同行 交流 等 因素 影响 ,新颖 性 强 的 研究 成 
果 在 短 时 间 内 更 难 被 理解 和 认可 ,从 而 产生 一 系列 负 
MAU ,如 更 低 的 论文 发 表率 '" .研究 成 果 的 学 
科 价值 和 贡献 被 低估 并 导致 这 些 论文 的 作者 被 逐渐 边 
缘 化 汶 。 此 外 ,新 颖 性 高 的 研究 计划 在 科研 基金 的 评 
审 中 也 更 容易 被 误解 而 得 到 低 分 ,被 淘汰 出 局 1。 对 
新 颖 性 的 这 种 “偏见 ” ,并 非 是 科研 领域 独 有 的 ,在 其 
他 领域 也 存在 。 例 如 ,在 商业 领域 也 存在 个 人 或 集体 
对 新 颖 性 观点 的 偏见 ”-””。 一 些 研究 指出 ,这 种 偏见 


产生 的 根源 除了 商业 领域 追求 降低 成 本 和 实用 性 而 形 
成 的 有 限 理性 ,更 在 于 人 们 对 于 新 观点 的 理解 机 
制 一 一 人 们 在 理解 新 观点 时 ,会 利用 自身 的 经 历 .知识 
等 来 弥补 新 观点 与 已 有 认 知 之 间 的 信息 缺口 (informa- 
tional gap) ,而 新 颖 性 强 的 内 容 造 成 的 信息 缺口 不 容易 
在 这 个 机 制 下 得 到 弥补 ,从 而 导致 其 被 理解 和 接受 的 
ERE? 。 

由 于 新 颖 性 是 一 把 双 刃 剑 , 研 究 者 往往 在 追求 新 
颖 性 的 同时 ,保持 一 定 的 传统 性 。 所 谓 “传统 性 ”, 并 
非 是 新 颖 性 的 对 立 面 ,而 表现 为 与 已 有 知识 和 理论 体 
系 的 紧密 关联 。 传 统 性 的 增加 有 助 于 弥补 新 颖 性 的 内 
容 造 成 的 信息 缺口 ,从 而 使 新 颖 性 的 内 容 更 容易 地 被 
接受 55 2 。 从 另 一 个 角度 来 看 ,科学 研究 中 新 颖 内 容 
的 产生 离 不 开 对 已 有 知识 或 理论 的 传承 和 发 展 , 即 通 
过 对 已 有 知识 理论 ,技术 或 方法 的 梳理 归纳 ,进而 形 
成 具有 创造 性 的 内 容 。 这 一 特点 在 图 情 领 域 的 研究 中 
亦 有 体现 。 例 如 ,杜威 在 论述 图 书馆 员 职 业 教 育 的 必 
要 性 时 ,并 没有 从 其 新 创立 的 十 进 制 分 类 法 的 角度 展 
开 论述 ,而 是 以 图 书馆 员 服 务 读者 .图 书馆 社会 教育 等 
业内 业 外 更 熟悉 的 角度 出 发 ”; 王 重 民 在 阐述 《四 库 
全 书 总 目 ) 的 目录 学 价值 时 ,并 没有 直接 介绍 《四 库 全 
书 总 目 》 的 内 容 特点 ,而 是 从 大 家 更 为 熟悉 的 《四 库 全 
书 ) 编 纂 历史 背景 出 发 ,在 介绍 《四 库 全 书 总 目 ) 编 自 
过 程 的 基础 上 ,分 析 其 目录 编纂 方法 的 特点 """。 总 
之 ,图 情 领 域 学 术 成 果 的 创新 离 不 开 对 已 有 知识 的 传 
承 和 发 展 ”。 图 情 领 域 的 研究 者 在 追求 新 颖 性 的 同 
时 ,也 需要 在 传统 性 上 下 功夫 ,以 体现 学 术 传 承 和 积 
淀 "5 。 因 此 ,传统 性 突出 的 研究 成 果 有 助 于 帮助 其 
他 研究 者 理解 现 有 研究 的 发 展 脉络 ,也 能 产生 更 广泛 
的 学 科 影响 力 。 由 此 ,得 出 如 下 假设 ; 

假设 2: 图 情 领域 的 研究 论文 ,传统 性 越 强 , 学 科 
影响 力 越 大 。 
2.2 ”团队 作者 与 研究 成 果 的 新 颖 性 、 传 统 性 的 关系 

依 时 间 维 度 横向 对 比 可 以 发 现 ,论文 的 篇 均 作者 
数量 在 不 断 增 加 ;同时 , 随 着 科研 复杂 度 的 不 断 提 高 ， 
当前 高 影响 力 的 研究 成 果 几 乎 都 是 以 团队 的 形式 完 
成 。 对 团队 作者 的 研究 有 助 于 厘清 研究 成 果 新 颖 性 
和 传统 性 形成 的 微观 机 制 。 不 少 研究 认为 ,作者 团队 
规模 的 扩大 有 助 于 形成 更 具 多 样 性 的 团队 ,从 而 将 不 
同学 科 领 域 .不 同 深度 和 广度 的 知识 融合 ,进而 有 助 于 
突破 固有 的 研究 边界 ,产生 更 具 创 新 性 和 影响 力 的 学 
RRR ;同时 ,合作 者 团队 成 员 之 间 的 互相 选 
择机 制 有 助 于 保障 研究 成 果 质 量 的 下 限 , 即 减 小 产生 
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很 差 的 学 术 成 果 的 可 能 性 鸣 。 此 外 ,作者 团队 规模 扩 
大 也 带 来 了 团队 协调 的 成 本 增加 和 沟通 困难 等 负面 影 
wj 995 ,因此 ,这 些 研 究 普遍 认为 保持 合理 的 团队 
规模 更 有 助 于 创新 。 我 国 图 情 领域 科研 合作 的 特点 与 
这 些 研究 基本 一 致 ,呈现 出 论文 以 2 -3 人 合作 为 主 的 
趋势 ,并 且 越 来 越 多 的 高 影响 力 论文 是 合作 作者 完成 
的 55 。 因 此 ,可 以 得 出 假设 

假设 3 :在 图 情 领域 ,团队 作者 的 研究 论文 更 具 学 
科 影 响 力 。 
3 ”方法 与 数据 
3.1. 数据 来 源 及 其 预 处 理 

中 文 论文 数据 库 有 多 种 来 源 ,笔者 选择 CSSCI 数 
据 库 ,因为 该 数据 库 的 数据 质量 较 之 于 万 方 、 维 普 、 知 
等 商业 数据 库 更 好 ,特别 是 该 数据 库 将 作者 和 作者 
立 进行 了 一 一 对 应 ,降低 了 消 歧 的 难度 。 笔 者 选择 
.GSSCI 数据 库 收录 的 所 有 图 书馆 学 情报 学 领域 的 其 
HE 2000 年 至 2019 年 20 年 间 所 发 表 的 所 有 论文 作 
HEER ,并 对 其 进行 数据 清洗 。 首 先 ,去 掉 样 本 中 的 通 
向 \ 社 论 .勘误 等 研究 价值 不 大 的 文献 类 型 ,最 终 保留 
76301 篇 研究 论文 或 综述 。 然 后 ,对 样本 中 的 作者 和 
作 各 单位 进行 消 战 。 作 者 消 歧 主要 利用 部 分 论文 的 作 
AA 中 的 出 生日 期 信息 ,并 结合 论文 自 引 和 是 否 存 
在 朗 同 合作 者 的 情况 综合 判断 。 作 者 单位 信息 并 非 本 
颈 活 注 的 重点 ,因此 只 在 研究 机 构 层面 ( 校 级 ) ,利用 
教育 部 公布 的 机 构 名 称 变动 公告 对 机 构 名 称 变更 进行 
处 理 ,确保 机 构 名 称 的 统一 。 最 后 ,通过 抽查 的 方式 进 
行内 工 核验 确保 作者 和 作者 单位 的 消 歧 质 量 。 
3.2 ”变量 及 其 测量 
3.2.1 因 变 量 : 学 科 影 响 力 
通常 而 言 ,不 少 研究 以 论文 被 引 频率 或 百 分 位 数 
来 测量 论文 的 学 科 影 响 力 , 越 来 越 多 的 研究 强调 百 分 
位 数 的 优势 *“ ,但 学 界 还 没有 形成 广泛 认可 的 标准 
来 界定 被 引 量 在 前 百 分 之 几 的 论文 为 高 被 引 论文 ,或 
者 说 具有 广泛 影响 力 的 论文 。 在 研究 实践 中 ,通常 选 
择 一 个 学 科 中 论文 被 引 量 的 前 1% 、 前 5% 或 前 10% 等 
不 同 的 标准 来 界定 “7 2。 参照 相关 研究 ”0 ， 
并 考虑 到 CSSCI 数据 库 中 的 被 引 关系 更 为 稀疏 ,笔者 
选择 被 引 量 前 5% 作为 高 被 引 论文 的 标准 来 测量 论文 
的 学 科 影 响 力 。 同 时 ,以 被 引 量 前 1% 和 前 10% 作为 
替代 测量 以 检验 该 标准 的 统计 稳健 性 。 此 外 ,由 于 图 
情 领域 引用 关系 的 稀 芍 性 ,高 被 引 论 文通 常 只 能 说 明 
非常 小 的 一 部 分 论文 的 学 科 影响 力 ,而 不 能 说 明 一 般 


hi5 n 7] 77^ 。 为 了 更 稳健 地 测量 学 科 影 响 力 ， 
， 仓 文 被 引 总 量 作为 学 科 影 响 力 的 替代 测量 
进一步 检验 模型 的 统计 稳健 性 
3.2.2 自 变 量 :新 颖 性 和 传统 性 

笔者 采用 一 种 优化 后 的 MCMC 方法 以 测量 新 颖 
VERMES YET T 。 这 种 方法 认为 ,新 颖 性 或 传统 性 都 
是 一 个 相对 的 概念 ,不 能 直接 以 观测 到 的 频率 值 作为 
新 颖 性 或 传统 性 的 测量 ,而 需 与 一 定 的 标准 进行 比较 ; 
一 个 合适 且 相 对 客观 的 方式 是 与 随机 概率 进行 比 
较 ” ”5 , 即 排除 观测 值 中 “常见 "或 “不 常见 "的 偶 
然 因素 ”"" ,进而 说 明 内 容 的 新 颖 性 。 例 如 ,一 个 概 
UNQUAM ie ee a 
新 ” ,无 法 直接 从 可 观测 的 “出 现 10 次 ”中 得 出 结论 ， 
e cu uc 
个 学 科 中 可 能 出 现 的 次 数 进行 比较 来 说 明 其 新 颖 性 。 

以 此 为 出 发 点 ,这 些 研究 认为 论文 的 参考 文献 很 
好 地 体现 了 论文 的 学 科 基础 及 其 对 已 有 知识 的 利用 情 
况 ,科学 研究 成 果 的 新 颖 性 (或 传统 性 ) 体现 在 论文 的 

共 引 文献 的 新 颖 程度 (或 传统 程度 ) 上 。 通 过 测度 共 
引文 献 的 新 颖 程度 (或 传统 程度 ) 可 以 得 到 科学 研究 
成 果 的 新 颖 性 (或 传统 性 ) 的 程度 。 具 体 算法 是 : 

(1) 根 据 论文 的 共 引 文献 整理 其 中 所 有 出 现 的 期 
刊 的 两 两 组 合 

(2) 整理 所 有 耸 文 共 引 文献 中 的 期 刊 两 两 组 合 ， 
按 年 度 记录 下 各 组 合 的 频率 o。 

(3) 根 据 论 文 间 的 引用 关系 ,构造 引文 网 络 。 与 
此 同时 ,为 了 得 到 可 以 比较 的 “随机 概率 ” ,这 些 研究 
采用 基于 MCMC 的 方法 ,通过 将 观测 到 的 引文 网 络 随 
机 化 ,来 模拟 出 可 比较 的 引文 网 络 。 由 于 MCMC 的 方 
法 对 算 力 要 求 较 高 , B，Uzzi 等 采用 吉 布 斯 采样 法 
( Gibbs sampling) 的 方法 来 随机 化 观测 到 的 引文 网 
络 ” ,并 建议 通过 交换 观测 到 的 引文 网 络 中 各 个 子 图 
内 不 少 于 nn x2 logo n; 次 的 引用 关系 ,其 中 ,n,; 为 该 引 
文 网 络 中 第 i 个 子 图 的 引用 关系 总 数 ,使 MCMC 收敛 
或 近似 收敛 以 得 到 随机 化 后 的 引文 网 络 。 该 网 络 的 节 
点 数 、 边 数 、 各 个 节点 的 入 度 和 出 度 均 与 观测 到 的 网 络 
一 致 , 且 随 机 化 后 被 引 论文 被 引 的 年 份 及 其 引用 来 源 
论文 发 表 的 年 份 都 没有 变化 。 这 里 需要 注意 两 点 : 
@ 吉 布 斯 采样 方法 并 不 是 严格 随机 ;@B. Uzzi 等 建议 
的 交换 次 数 并 非 是 MCMC 达到 收敛 的 必要 条 件 ,而 是 
在 对 算 力 要 求 较 高 时 可 以 采取 的 一 个 经 验 法 则 。 

(4) 将 步骤 (3) 重 复 10 次 ,得 到 10 个 随机 化 后 的 
引文 网 络 。 统 计 每 个 随机 化 后 引用 网 络 中 每 篇 论文 的 
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引用 关系 ,得 出 各 期 刊 组 合 被 共 引 的 频率 ,计算 该 频率 
的 均值 。 与 标准 差 o, 然 后 计算 各 期 刊 两 两 组 合 的 标 
准 化 分 数 (z) ,计算 公式 如 下 : 


an 公式 (1) 
g 


(5) 根 据 某 一 论文 共 引 期 刊 两 两 组 合 的 标准 化 分 
数 z 的 分 布 ,选择 合适 的 百 分 位 数 作为 该 论文 新 颖 性 
和 传统 性 的 测量 。 该 方法 的 创新 性 在 于 :现实 中 可 观 
测 的 频率 值 只 有 一 个 ,而 通过 MCMC 的 方法 可 以 将 观 
测 到 的 引文 网 络 随机 化 ,并 通过 计算 标准 化 分 数 (z 分 
数 ) 以 消除 随机 因素 带 来 的 影响 。 由 于 均值 。 是 基于 
随机 概率 得 到 的 ,因此 ,得 到 的 z 分 数 小 于 0 的 组 合 是 
相 较 于 随机 概率 而 言 更 为 罕见 的 组 合 ,具有 一 定 的 新 
颖 性 ,而 标准 化 分 数 大 于 0 的 组 合 , 则 是 更 为 “传统 ”的 
Hz. FL 1 展示 了 任 选 的 一 篇 论文 (论文 为 吴 慰 慈 与 
AS 2001 年 发 表 于 (图 书馆 论坛 ) 的 (2006 年 区 
插销 学 学 术 进 展 )) 共 引 的 期 刊 两 两 组 合 的 观测 值 和 
模拟 值 的 累计 分 布 情况 (此 处 模拟 值 的 计算 采用 的 是 
在 语文 中 阅 释 的 优化 后 的 方法 , 且 模 拟 值 为 10 次 模拟 
后 得 到 的 均值 ) 。 由 图 1 可 知 , 观 测 值 较为 稀 朴 ,而 模 
氢 仿 分布 相 对 密集 ;模拟 值 类 似 于 随机 产生 的 “ 基 
准 汪 与 这 个 基准 相 比较 可 以 更 好 地 理解 观测 值 的 相对 
PEE. 
~ 


一 一 观测 什 
一 一 模拟 值 


图 1 一 篇 论文 中 可 观测 到 的 论文 共 引 期 刊 两 两 
组 合 出 现 的 频率 与 通过 随机 模拟 得 到 的 论文 
共 引 期 刊 两 两 组 合 出现 的 期 望 频率 


笔者 对 新 疾 性 和 传统 性 的 测量 进行 了 优化 。 不 少 
研究 强调 ,引文 网 络 具 有 很 强 的 偏好 依附 ( preferential 
attachment) 特性 ”“ , 即 被 引用 过 的 论文 更 容易 获得 
更 高 的 被 引 量 。 因 此 ,在 将 实际 观测 到 的 引文 网 络 随 
机 化 的 过 程 中 应 当 保 持 引 文 网 络 的 这 种 特性 ,而 不 能 
假定 论文 的 引用 (或 不 被 引用 ) 是 一 个 随机 过 程 。 为 
了 更 好 地 模拟 这 个 特性 ,笔者 借鉴 随机 过 程 中 基于 狄 
利克 雷 过 程 的 中 和 餐馆 过 程 ( Chinese restaurant 


process)“" ,具体 算法 是 : 

(1) 初 始 情 况 下 ,假定 每 篇 论文 被 引 的 概率 是 均 
等 的 。 

(2) 采 用 吉 布 斯 采样 法 ,选择 任意 的 两 组 观测 到 
的 存在 引用 关系 的 论文 ,在 交换 其 引用 关系 时 , 先 考虑 
论文 被 引 的 概率 p 是 否 大 于 一 个 0 到 1 之 间 的 随机 值 
u, 如 果 大 于 u 则 交换 引用 关系 ,如 果 小 于 则 不 交换 
引用 关系 。 

(3) 在 后 续 过 程 中 ,利用 狄 利克 雷 分 布 的 概率 密 
度 函 数 来 修正 随机 值 u, 即 根据 观测 到 的 论文 和 期 刊 
被 引 的 情况 调整 论文 和 期 刊 的 引用 偏好 ,使 得 某 一 论 
文 被 引 概率 会 随 该 论文 被 引 次 数 和 论文 所 在 期 刊 被 引 
次 数 的 增加 而 增加 。 

(4) 重 复 步骤 (2) 和 (3) ,直至 所 有 引用 关系 都 至 
少 交换 一 次 。 这 里 需要 注意 ,由 于 本 研究 的 引文 网 络 
规模 中 等 ,因此 可 以 采用 全 部 交换 的 方式 。 如 果 引 文 
网 络 规模 太 大 ,交换 所 有 引用 关系 的 算 力 成 本 会 非常 
大 , 则 此 时 可 以 考虑 使 用 B. Uzzi 等 推荐 的 经 验 法 则 。 

为 了 直观 地 说 明 新 颖 性 和 传统 性 的 测量 ,因此 随 
机 选取 了 一 篇 论文 (论文 为 马 费 成 和 裴 雷 于 2005 年 发 
表 在 《情报 学 报 》 的 《我 国信 息 资源 共享 实践 及 理论 研 
究 进 展 》) 并 在 图 2 中 展示 该 论文 参考 文献 的 共 引 期 刊 
组 合 的 标准 化 分 数 的 分 布 情况 。 从 图 2 可 看 出 ,在 前 
50 百 分 位 数 之 前 ,标准 化 分 数 的 整个 分 布 较为 长 尾 ， 
而 在 其 之 后 ,分 布 更 为 密集 。 这 说 明 相 对 新 颖 的 期 刊 
组 合 在 文献 中 出 现 的 概率 的 确 比较 稀 玻 ,而 相对 传统 
的 期 刊 组 合 出 现 的 概率 比较 频繁 。 这 也 从 侧面 说 明 标 
准 化 分 数 的 第 10 百 分 位 数 的 期 刊 组 合 确实 出 现 得 "更 

为 说 明 新 颖 性 和 传统 性 的 整体 情况 ,将 2000 年 至 
2019 年 分 成 两 个 10 年 (2000s 和 2010s) ,分 别 统计 了 
这 两 个 10 年 期 间 发 表 的 论文 的 新 疾 性 (其 参考 文献 中 
所 有 期 刊 组 合 的 标准 化 分 数 的 第 10 百 分 位 数 , 见 图 
3) 和 传统 性 (其 参考 文献 中 所 有 期 刊 组 合 的 标准 化 分 
数 的 第 50 百 分 位 数 , 见 图 4) 的 情况 。 从 图 3 可 以 看 
出 ,在 2000 -2019 年 间 , 我 国 图 情 领 域 论文 整体 的 新 
颖 性 在 提高 ,其 累计 分 布 比较 稀 玻 ,第 10 百 分 位 数 对 
应 的 期 刊 组 合 也 确实 更 为 新颖” 。 在 2000 - 2009 年 
间 (n=28 890) ,只 有 14.76% 的 论文 其 新 颖 性 是 小 于 
0 的 ,而 在 2010 -2019 年 间 (n =41 317) ,有 28.83% 的 
论文 其 新 颖 性 小 于 0, 增 长 明显 。 从 图 4 可 以 看 出 ,在 
2000 - 2019 年 间 ,我 国 图 情 领域 论文 整体 的 传统 性 保 
持 在 较 高 的 水 平 ,其 累计 分 布 在 标准 化 分 数 较 小 的 区 
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[EIE Fi, "e ELI Fé nt Fu. Tk 2000 - 2009 年 间 ， 
图 情 领 域 的 论文 中 只 有 2. 2396 的 论文 的 传统 性 小 于 
0 ,而 在 2010 - 2019 年 间 , 这 个 比例 变化 不 明显 ,为 
2.32% 。 这 些 结果 说 明 , 标 准 化 分 数 分 布 中 的 第 10 百 
分 位 数 可 以 较 好 地 反映 其 新 颖 性 ,而 第 50 百 分 位 数 可 
以 较 好 地 反映 其 传统 性 。 此 外 ,这 些 结果 与 B，Uzzi 等 
的 研究 结果 基本 类 似 ” ,但 相 较 之 下 ,新颖 性 的 比例 要 
明显 低 得 多 ,而 传统 性 的 比例 明显 更 高 。 


100 
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论文 参考 文献 中 的 所 有 期 刊 组 合 对 应 的 z 分 数 


CE2 论文 引用 的 期 刊 两 两 组 合 的 标准 化 分 数 分 布 
及 其 与 新 颖 性 和 传统 性 关系 图 例 


论文 新 疾 性 


图 3 2000 -2009 年 和 2010 -2019 年 两 个 
10 年 间 论 文 新 颖 性 的 整体 情况 


3.2.3 控制 变量 

参照 以 往 研究 ,为 了 排除 潜在 的 替代 解释 ,在 回归 
模型 中 加 入 论文 发 表 期 刊 .论文 发 表 年 份 和 论文 作者 
数量 3 个 变量 作为 控制 变量 。 其 中 ,论文 发 表 期 刊 是 
分 类 变量 ,论文 发 表 年 份 是 自然 年 份 的 分 类 变量 ,在 模 
型 中 控制 其 固定 效应 。 参 照 B，Uzzi 等 提出 的 团队 作 
者 规模 的 分 类 方法 以 及 我 国 图 情 领域 合作 者 的 特 
AO ,将 论文 作者 数量 分 为 独立 作者 、 双 人 合作 和 团 
队 合 作 (3 人 及 以 上 )3 类 。 
3.3 回归 模型 及 分 析 策 略 

与 研究 假设 对 应 ,构造 多 元 回归 模型 ,公式 如 下 


累积 分 布 /5 
2 


-4 -2 0 2 4 
论文 的 传统 性 
图 4 2000-2009 年 和 2010 -2019 年 两 个 
10 年 间 论文 传统 性 的 整体 情况 


所 示 : 

学 科 影 响 力 , = B, x 新 颖 性 , + B, x 传统 性 , + B. x 
作者 数量 , + Bs 论 文 发 表 期 刊 + Bo。+e 公式 (2) 

其 中 ,Bu 为 常数 项 ,s 为 随机 误差 ,下 标 t 代 表 论 
文 发 表 年 份 ,B, 到 B., 为 待 估计 系数 , 且 ,B, >0,B, >0， 
B; >0。 

利用 上 述 模型 以 logistic 回归 检验 论文 新 颖 性 、 传 
统 性 和 作者 数量 对 论文 成 为 高 被 引 论文 概率 的 影响 ， 
从 而 说 明 这 些 因素 与 论文 学 科 影 响 力 的 关系 。 需 要 说 
明 的 是 ,使 用 标准 化 分 数 测量 新 颖 性 时 ,标准 化 分 数 越 
小 ,新 颖 性 越 强 。 因 此 ,如果 要 检验 新 颖 性 越 强 则 论文 
成 为 高 被 引 论文 的 概率 越 高 这 一 假设 ,而 将 标准 化 分 
数 累 积分 布 的 前 10 百 分 位 数 直 接 作 为 新 颖 性 的 测量 
标准 进行 回归 分 析 时 ,会 因为 人 为 因素 导致 B, 为 负 。 
这 容易 造成 对 回归 分 析 结 果 的 误解 。 鉴 于 此 ,在 回归 
分 析 时 ,选择 标准 化 分 数 累 积分 布 前 10 百 分 位 数 的 相 
反 数 作为 新 颖 性 的 测量 标准 ,这 样 就 能 保证 该 变量 值 
越 大 ,新颖 性 越 强 。 此 外 ,在 分 析 过 程 中 ,严格 控制 出 
版 年 和 作者 数量 的 固定 效应 。logistic 回归 分 析 结 果 见 
表 1。 


4 分析 结 果 


4.1 新 颖 性 ,传统 性 与 论文 学 科 影 响 力 的 关系 

3&1 显示 了 以 论文 被 引 量 前 596 为 标准 来 界定 高 
被 引 论文 的 logistic 回归 分 析 结 果 。 其 中 ,模型 1 使 用 
全 部 论文 样本 ,模型 2 只 使 用 2000 -2009 年 间 的 论文 
样本 ,模型 3 只 使 用 2010 - 2019 年 间 的 论文 样本 。 整 
体 来 看 ,论文 的 新 颖 性 对 其 成 为 高 被 引 论文 优势 比 
(odds ratio) 的 提升 非常 显著 (B=0.109,p<0.000 1), 
论文 的 传统 性 对 其 成 为 高 被 引 论文 优势 比 的 提升 也 非 
wm (B =0.292,p «0.000 1)。 对 比 2000 -2009 年 
和 2010 -2019 年 的 两 个 10 年 间 的 情况 可 以 看 出 ， 论 
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表 1 logistic 回归 分 析 结 果 


模型 1 模型 2 模型 3 
因 变 量 高 被 引 论文 高 被 引 论文 高 被 引 论 文 
(前 5% ) (前 5% ) (前 5% ) 
新 颖 性 0. 109 *** 0.120 *** 0. 102 *** 
(0.013) (0.022) (0.016) 
传统 性 0. 292 *** 0.241 *** 0. 347 *** 
(0.035) (0.052) (0.047) 
双人 作者 0.359 *** 0.246 *** 0. 474 *** 
(0.041) (0.059) (0.059) 
团队 作者 0.472 ** 0.373 "** 0.569 * 
(0.047) (0.076) (0. 062) 
发 表 期 刊 -0.003 *** -0.003 *** -0.002 *** 
(0.000) (0.000) (0.000) 
发 表 年 份 固定 效应 是 是 是 
常数 项 一 2. 466 "* -2.165 ** -4.195 ** 
(0.127) (0.157) (0. 165) 
"T Tog likelihood -13 065.182 -5 979. 789 -7 073.442 
Chi2 1 138.918 ** 479.137 *** 673.354 ** 


^ 样本 量 70 207 28 890 41317 
COE: D3 个 模型 中 的 系数 均 为 初始 系数 ;@ 括 号 内 为 稳健 标准 


误 5 侈 显著 性 水 平 标记 : p «0.05, "p «0.01, ** p «0.001 


六 新 颖 性 对 其 成 为 高 被 引 论文 优势 比 的 影响 在 减弱 ， 
醒 8 文 传统 性 对 其 成 为 高 被 引 论文 优势 比 在 增强 。 这 
些 缚 果 都 为 说 明 新 颖 性 和 传统 性 对 学 科 影 响 力 的 作用 
AER Ch mosca 

= "与 线性 回归 不 同 ,在 logistic 回归 中 , 因 变 量 与 自 
变量 的 关系 是 非 线 性 的 ,两 个 自 变量 对 因 变 量 的 影响 
< 告 价 于 两 个 自 变量 系数 的 累加 。 为 进一步 分 析 
PENE ,传统 性 对 学 科 影响 力 的 作用 ,分 别 将 新 颖 性 


5.00 3.15 


2.00 新 颖 性 低 


成 为 高 被 引 论文 的 概率 的 变化 /% 
B 
S 


新 颖 性 高 


PT 
传统 性 低 jum 


图 5 论文 新 颖 性 和 传统 性 的 不 同 组 合 
对 其 成 为 高 被 引 论 文 概率 的 影响 


43.17% (p «0.000 1) ,团队 作者 的 论文 成 为 高 被 引 论 
文 的 优势 比 独立 作者 论文 的 概率 要 高 60. 3396 (p < 
0.000 1) 。 对 比 表 1 的 模型 2 和 模型 3, 可 以 进一步 看 
出 ,在 2000 年 至 2019 年 ,作者 数量 对 于 我 国 图 情 领 域 
的 论文 成 为 高 被 引 论文 的 影响 在 增强 。 这 充分 说 明了 
团队 作者 在 学 科 创 新 中 的 优势 ,并 且 随 着 时 代 的 发 展 ， 
这 种 优势 在 扩大 。 

为 了 进一步 探究 作者 论文 数量 的 影响 ,笔者 统计 
了 两 个 10 年 间 独 立 作 者 、 双 人 作者 和 团队 作者 的 所 有 
论文 的 标准 化 分 数 前 10 ,15 ,20 ,25 ,30 ,35 40 ,45 和 50 
百 分 位 数 的 均值 ,结果 见 图 6。 从 整体 来 看 , 随 着 作者 
数量 的 增加 ,论文 的 标准 化 分 数 的 前 35 百 分 位 数 基 本 
都 呈现 下 降 的 趋势 ,而 第 35 百 分 位 数 之 后 的 变化 不 显 
著 。 如 果 对 比 前 后 两 个 10 年 ,不 难 发 现 , 随 着 时 代 的 


(或 传统 性 ) 的 第 25 百 分 位 数 和 第 75 百分数 作为 其 高 
li EE , ,可 以 形成 新 颖 性 高 且 传 统 性 高 .新 颖 性 低 且 
传统 性 高 ,新颖 性 低 且 传统 性 低 ,新颖 性 高 且 传 统 性 低 
4 种 不 同 的 组 合 情 况 , 进 而 可 以 分 析 每 种 情况 下 新 颖 
性 和 传统 性 对 学 科 影 响 力 的 联合 边际 作用 。 分 析 结 
如 图 5 所 示 , 当 新 颖 性 和 传统 性 都 很 高 时 ,论文 成 为 高 
被 引 论文 的 概率 是 7. 08% (p «0.000 1) ;在 新 颖 性 和 
传统 性 都 很 低 时 ,论文 成 为 高 被 引 论文 的 概率 是 
3.15% (p «0.000 1) ;新 颖 性 高 而 传统 性 低 时 ,论文 成 
为 高 被 引 论文 的 概率 是 4. 90% (p <0. 000 1) ;新 颖 性 
低 而 传统 性 高 时 , 论文 成 为 高 被 引 论文 的 概率 是 
4.60% (p «0.000 1) 。 换 言 之 ,新 颖 性 高 的 论文 ,无 论 
其 传统 性 高 低 都 有 更 高 的 概率 成 为 高 被 引 论文 。 
4.2 论文 作者 数量 与 论文 学 科 影响 力 的 关系 

从 表 1 的 模型 1 中 可 以 看 出 , 相 较 于 独立 作者 的 
论文 ,双人 作者 的 论文 成 为 高 被 引 论文 的 优势 比 要 高 


发 展 ,无 论 是 独立 作者 、 双人 作者 还 是 团队 作者 ,其 整 
体 的 标准 化 分 数 都 在 下 降 。 此 外 ,在 2000 -2009 的 10 
年 间 ,独立 作者 ` 双人 作者 和 团队 作者 在 这 些 标准 化 分 
数 的 均值 上 差距 不 大 ;而 在 2010 -2019 年 的 10 年 间 ， 
独立 作者 、 双 人 作者 和 团队 作者 在 这 些 标准 化 分 数 的 
均值 差距 逐渐 扩大 。 这 些 变化 趋势 都 在 前 35 百 分 位 
数 ,特别 是 新 颖 性 上 ,体现 得 更 为 明显 。 这 可 能 意味 
着 ,对 我 国 图 情 领 域 而 言 ,作者 数量 的 增加 有 可 能 会 促 
进 论文 的 新 颖 性 ,而 对 传统 性 的 影响 不 大 。 
4.3 分 析 结 果 的 稳健 性 

模型 整体 的 共 线 性 程度 较 低 。 在 控制 论文 发 表 年 
份 的 固定 效应 后 , 表 1 中 模型 1 的 方差 膨胀 因子 为 
2.63 ,主要 自 变量 的 方差 膨胀 因子 均 小 于 1.7, 因 此 模 
型 不 存在 多 重 共 线 性 的 问题 。 而 异 方差 检验 (怀特 检 
验 ) 的 卡 方 值 为 1 819.22(p «0.001) ,这 说 明 存 在 异 方 
差 问题 ,因此 ,在 回归 分 析 时 , 均 使 用 稳健 标准 误 代替 
一 般 的 标准 误 ” 。 
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CD 此 外 ,使 用 因 变 量 和 自 变量 的 多 个 替代 测量 来 检 


加 归 分 析 结果 的 稳健 性 。 首 先 ,用 论文 发 表 后 4 年 
内 的 被 引 总 量 作为 因 变量 ,以 相同 的 模型 设 定 进行 负 
-3 员 回 归 ( 见 表 2 的 模型 1) 。 采 用 论文 发 表 4 年 内 的 
被 引 量 ,主要 依据 是 我 国 图 情 领域 文献 半衰期 大 约 为 
3 年 。 得 到 的 结果 与 基准 模型 基本 一 致 ,新 颖 性 和 
传 强 性 的 系数 正 负 及 其 显著 性 都 没有 变化 。 其 次 ,将 
高 发 引 论文 的 界定 标准 变 为 被 引 量 前 1% 的 论文 和 被 
SPERE 10% 的 论文 ,以 相同 的 模型 设 定 进行 logistic 回 
ACI 2 模型 2 ,模型 3) ,结果 也 与 基准 模型 基本 一 
m nan 
4 


在 模型 2 中 ,新 预 性 系数 的 显著 性 略 有 下 降 (p = 
0.019), 

再 次 ,选择 标准 化 百 分 位 数 累计 分 布 的 前 15 ,20 
25 30 百 分 位 数 作为 新 前 性 的 禁 代 测量 ,回归 分 析 结 
果 见 表 3。 从 表 3 可 以 看 出 ,采用 不 同 的 标准 时 ,新 蜂 
性 对 论文 成 为 高 被 引 论文 的 影响 非常 显著 ,各 模型 对 
应 系数 的 p 值 均 小 于 0.001。 这 些 结果 充分 说 明了 原 
分 析 结 果 的 统计 稳健 性 。 
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不 同时 期 独立 作者 、 双 人 作者 和 团队 作者 的 作品 的 期 刊 两 两 组 合 分 布 的 
标准 化 分 数 前 50 百 分 位 数 的 平均 水 平 


表 2， 因 变量 选择 不 同 标准 测定 的 回归 分 析 结 果 
d 2 Ua 
因 变 量 人 x a Net 
论文 被 引 次 数 (Bi 195) (前 10%) 
新 颖 性 0. 062 *** 0. 066 * 0. 102 *** 
(0.005) (0. 029) (0.010) 
传统 性 0. 141 *** 0.310 *** 0.246 *** 
(0.010) (0.080) (0.024) 
双人 作者 0.216 ** 0.529 ** 0.353 ** 
(0.016) (0. 089) (0. 030) 
团队 作者 0.295 *** 0.576 *** 0.501 *** 
(0.017) (0. 103) (0.034) 
发 表 期 刊 - 0. 001 *** - 0.003 *** - 0.002 *** 
(0.000) (0. 000) (0. 000) 
发 表 年 份 固定 效应 是 是 是 
常数 项 0.744 ** -1.781 *'* -4.025 *** 
(0.052) (0. 092) (0.270) 
Inalpha 0. 437 *** - - 
(0.011) 
log likelihood - 116 041. 64 -21 546.902 -3 671.103 
Chi2 3 812.503 *** 1 752.522 ** 348.363 *** 
样本 量 70 207 70 207 70 207 


口 


注 : 中 模型 1 为 负 JH ,模型 2 和 模型 3 为 logistic 回归 , 模 
P 的 系数 均 为 初始 系数 ;@) 括 号 内 为 稳健 标准 误 ;@@ 显 著 性 水 了 


项 
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5.1 新 颖 性 与 传统 性 的 测量 
5.1.1. 两 种 测量 方法 的 比较 

由 于 引文 网 络 的 特点 ,笔者 采用 一 种 优化 后 的 基 
T MCMC 的 测量 新 颖 性 与 传统 性 的 方法 。 通 过 与 B. 
Uzzi 等 提出 的 方法 得 到 的 结果 进行 比较 ,发 现 优化 后 
的 方法 具有 一 定 的 优势 。 首 先 ， 计 算 各 个 年 份 的 所 有 


id:'p«0.05, *p<0.01, 


期 刊 两 两 组 合 的 标准 化 分 数 ,并 比较 两 种 方法 得 到 的 
结果 均值 ,标准 差 和 最 值 等 ( 见 表 4)。 从 表 4 可 以 看 
出 ,两 种 方法 的 结果 似乎 没有 明显 差异 。 然 后 ,进一步 
计算 两 种 方法 得 到 的 结果 的 相关 性 ,相关 系数 为 
0.797 5(n 224 332 554,p «0.000 1), 


**p «0.001 
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表 3 自 变量 选择 不 同 标准 测定 的 logistic 回归 分 析 结 果 


模型 2 高 被 引 论文 


模型 3 高 被 引 论文 


模型 4 高 被 引 论文 


rS 模型 1 高 被 引 论文 
新 颖 性 -第 15 百 分 位 数 di 

新 颖 性 -第 20 百 分 位 数 

新 颖 性 -第 25 百 分 位 数 

新 颖 性 -第 30 百 分 位 数 


(0.015) 


0.080 ** (0.017) 


0.073 ** (0.021) 


0.069 * (0.027) 


传统 性 0.279 ** (0.036) 0.255 ** (0.037) 0.243 ** (0.040) 0.236 ** (0.044) 
论文 作者 数量 (基线 :独立 作者 ) 
双人 作者 0.365 ** (0.041) 0.371 ** (0.041) 0.373 ** (0.041) 0.375 ** (0.041) 
团队 作者 0.484 *** (0.046) 0.494 *** (0.046) 0.498 ** (0.046) 0.502 *** (0.046) 
发 表 期 刊 -0.003 *** (0.000) -0.003 ** (0.000) -0.003 *** (0.000) -0.003 *** (0.000) 
发 表 年 份 固定 效应 是 是 是 是 
常数 项 -2.447 "* (0.127) -2.417 ** (0.126) -2.399 *** (0.126) -2.385 ** (0.126) 
log likelihood -13 077. 766 - 13 087.899 -13 092.118 - 13 094.338 
Chi2 1 120. 040 *** 1 103.697 ** 1 097.467 *** 1 095.282 ** 
us 样本 量 70 207 70 207 70 207 70 207 
ex. :中 各 模型 中 的 系数 均 为 初始 系数 ;@ 括 号 内 为 稳健 标准 误 ;@ 显 著 性 水 平 标 记 :"p «0.05, "p«0.01, **p<0.001 
表 4 ”两 种 基于 MCMC 的 方法 将 引文 网 络 随机 后 标准 化 分 数 的 比较 
© 各 期 刊 组 合 标准 化 分 数 
方法 描述 性 统计 两 种 方法 结果 的 相关 性 分 析 
m hats HUM 最 大 值 全 部 样本 前 10% 样 本 前 30% 样 本 前 50% 样 本 
CN 本 文 提出 的 方法 2.175 1.281 -3.015 3.015 0.797 5 *** 0.662 4 ** 0.703 1 ** 0.727 0 *** 
Ch] Uzzi 等 提出 的 方法 2. 176 1.279 -3.011 3.015 
OE DOBAH: *p«0.05, *p<0.01, **p«0.001 


> 为 了 更 进一步 研究 这 种 差异 性 ,将 所 有 论文 通过 
丙种 不 同方 法 测 得 的 新 颖 性 和 传统 性 以 散 点 图 的 形式 
旦 饮 ( 见 图 7) 。 从 图 7 可 以 看 出 两 种 方式 的 差异 。 通 
过 呢 对 样本 + 检验 ,发 现 两 种 方法 得 到 的 结果 方差 齐 
次 5 各 优化 后 方法 测 出 的 新 颖 性 (标准 化 分 数 的 第 10 
百 耸 位 数 ) 均值 显著 低 于 B. Uzzi 等 提出 方法 得 到 的 结 

果 (T=2.22,p =0.013, 单 边 检 验 )。 同 时 ,优化 后 的 
方法 得 到 的 标准 化 分 数 的 第 15 .第 20 百 分 位 数 也 均 低 
于 原 方法 得 到 的 结果 (T 值 分 别 为 1. 65,1. 99,p 值 分 
别 为 0.049 ,0.023 , 单 边 检验 ) ,而 第 25 .第 30 第 35 第 
40 .第 45 和 第 50 百分数 的 标准 化 的 均值 不 存在 显著 
性 差异 。 这 说 明 两 种 方法 得 到 的 结果 的 整体 分 布 具有 
一 致 性 ,但 对 于 标准 化 分 数 靠 前 的 20% 存在 一 定 的 差 
异 。 为 了 进一步 说 明 这 种 差异 ,将 两 种 方法 的 结果 按 
不 同 的 百 分 位 数 进 行 相关 性 分 析 。 结 果 发 现 ,两 种 方 
法 得 到 的 结果 的 标准 化 分 数 均 排 在 前 10% ,其 相关 性 
为 0.662 4(n 21 675 706,p «0.000 1) ; 均 排 在 前 30% 
的 ,其 标准 化 分 数 的 相关 性 为 0.703 1(n 25 212 511,p 
«0.000 1) ; 均 排 在 前 50% 的 ,其 标准 化 分 数 的 相关 性 
为 0.727 0(n=9 871 118,p «0.000 1 )。 这 进一步 说 


明了 两 种 方法 得 到 的 结果 存在 一 定 的 差异 性 ,并 且 在 
标准 化 分 数 靠 前 的 部 分 差异 更 明显 。 这 意味 着 优化 后 
的 方法 对 新 绪 性 更 敏感 ,更 适应 稀 玻 的 引文 网 络 。 
5.1.2. 新 颖 性 传统 性 测量 的 适用 性 

为 了 直观 地 说 明 新 家 性 或 者 传统 性 测量 在 我 国 图 
情 领 域 的 适用 性 ,笔者 选择 2000 年 和 2019 年 的 一 些 
代表 性 的 期 刊 组 合 ,按照 标准 化 分 数 高 低 列 在 表 5 中 。 
从 表 5 可 以 看 出 ,这 些 期 刊 组 合 出 现在 参考 文献 中 的 
“偶然 程度 ”( 即 新 家 性) 与 预期 基本 一 致 。 例 如 ,《 中 
图 书馆 学 报 》 和 《大 学 图 书馆 学 报 》, 在 2000 年 和 
2019 年 经 常 同时 作为 参考 文献 出 现 。 在 2000 年 ,《 图 


Bi 


书馆 建设 ) 和 《情报 理论 与 实践 ) 的 组 合 , 相 较 于 随机 
概率 而 言 ,是 较为 新 颖 的 。 图 情 领域 与 计算 机 科学 的 


结合 在 2000 年 左右 是 具有 一 定 新 颖 性 的 ,在 2000 年 
《情报 学 报 》 与 4 人 工 智 能 学 报 》 的 组 合 的 标准 化 分 数 
恰好 为 0 ,而 在 2019 年 ,这 种 结合 已 经 是 司空见惯” 
如 在 2019 4E, Journal of the Association for MM 
Science and Technology 和 《软件 学 报 》 组 合 的 标准 化 分 
数 超过 了 2。 此 外 ,在 2019 年 ,Journal of Informetrics 和 
Science 的 组 合 已 经 很 常见 了 , 具有 很 强 的 传统 性 ,而 
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论文 新 颖 性 (B. Uzzi 等 的 方法 ) 


论文 新 颖 性 ( 优化 后 的 方法 ) 


图 7 


比较 常见 ,具有 和 较 强 的 传统 性 。 最 后 ,而 相 较 而 
昔 > 情 报 学 与 人 文 社会 科学 的 结合 具有 新 颖 性 ,在 
2 年,( 铺 报 学 报 》 与 (北京 大 学 学 报 (文科 版)》 的 
幼 合 具有 一 定 的 新 颖 性 ,在 2019 年 《情报 学 报 》 与 (中 


au 与 BMJ( British Medical Journal) 的 组 


2 


0 


论文 传统 性 (B. Uzzi 等 的 方法 ) 


-2 


论文 传统 性 ( 优化 后 的 方法 ) 


两 种 不 同方 法 测 得 的 新 颖 性 和 传统 性 的 比较 ( 图 中 黑色 对 角 线 为 y =x) 


国 社会 科学 》 的 组 合 具有 很 强 的 新 疾 性 。 而 图 书馆 学 
与 经 济 学 期 刊 的 组 合 更 具有 新 颖 性 :在 2000 年 ,最 为 
罕见 的 期 刊 组 合 之 一 是 《中 国 图 书馆 学 报 》 与 《经 济 研 
究 》; 而 在 2019 年 ,最 为 罕见 的 期 刊 组 合 之 一 是 《中 
图 书馆 学 报 》 与 American Economic Review, 


在 以 往 的 研究 中 ,对 新 颖 性 的 测量 方法 的 讨论 和 
批判 集中 在 新 颖 性 是 否 是 蜂 学 科 程 度 的 一 个 测量 ” 。 
尽管 从 表 5 中 能 大 致 看 出 新 颖 性 和 器 学 科 的 关系 ,但 
为 了 更 好 地 说 明 二 者 的 差异 ,图 8 展示 了 2000 年 、 


T 表 5 不 同时 代 的 代表 性 期 刊 组 合 的 标准 化 分 数 
N 期 刊 组 全 (期刊 ~ 期刊 gera 期 和 组 合 (期 刊 -期 刊 ) ， 
全 3.0122 中国 图 书馆 学 报 - 大 学 图 书馆 学 报 3.0122 
rhal of Documentation-Journal of Information Science 2.9215 Information Processing & Management-Scientometrics 3. 013 4 
Jounal of American Society for Information Science — 中 国 图 书馆 学 报 2.542 6 Journal of Informetrics-Science 3.0105 
RETE -知识 产权 1.6080 Journal of the Association for Information Science and Technology — 2.3035 
se" 软件 学 报 
Bios — College and Research Libraries 1.5570 ”图 书馆 -知识 产权 1.9287 
情报 知识 -Artificial Intelligence 0.7933 ”情报 资料 工作 - BMJ( British Medical Journal) 1.6089 
区 i 论坛 -RE 0.09063 ”情报 理论 与 实践 - Harvard Business Review 1.1411 
情报 学 报 - 人 工 智 能 学 报 0.0000 ”图 书馆 建设 - Information Processing & Management 0. 786 6 
档案 学 通讯 - 考古 0.0000 ”图 书馆 论坛 Politics 0.1685 
到 书馆 建设 -情报 理论 实践 -0.4874 ”档案 学 通讯 PLoS One -0.3469 
情报 学 报 -北京 大 学 学 报 (文科 版 ) -0.9170 图书 情报 工作 - 中 国 出 版 -1.002 5 
寻 书 情报 工作 - Science -1.4344 ”图 书 情报 知识 -Psychological Review -1.688 5 
到 书 情报 知识 -教育 研究 -2.1116 ”大 学 图 书馆 学 报 - Science -2.1154 
大 学 图 书馆 学 报 - 法 学 研究 -2.5704 RER - 中 国 社会 科学 -2.9520 
中 国 图 书馆 学 报 - 经 济 研 究 -2.8278 ”中 国 图 书馆 学 报 - American Economic Review -2.988 9 


显示 , 同 领 域 的 期 刊 组 合 的 确 会 带 来 很 高 的 标准 化 分 
数 , 即 很 高 的 传统 性 ,而 不 同 领域 的 期 刊 组 合 未 必 会 市 
来 高 的 新 颖 性 。 即 使 是 标准 化 分 数 均值 最 低 的 2019 
年 , 非 纯 图 情 领 域 期 刊 组 合 的 标准 化 分 数 均值 依然 大 


2010 年 和 2019 年 3 个 固 


定年 份 中 图 情 领域 期 刊 组 合 


(n2000 =200 ,n2010 =295 ,n2019 =350 ) 的 标准 化 分 数 


均值 和 非 纯 图 情 领 域 期 7 


J24 & (n2000 =9 177,n2010 


=47 472 „n2009 = 132 352) 的 标准 化 分 数 均 值 。 结 


于 0, 这 说 明 与 随机 概率 相 比 ,这 种 组 合并 不 具备 新 颖 
性 。 这 些 发 现 与 B，Uzzi 等 的 研究 结果 基本 一 致 ”, 充 
分 说 明 优化 后 的 方法 也 适合 用 于 我 国 图 情 领 域 论文 的 
新 活性 和 传统 性 的 测量 。 
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ROUES. 守 正 能 否 创 新 ? 基于 我 国 图 情 领 域 论 文 新 颖 性 和 传统 性 的 分 析 [3]. 图 书 情报 工作 ,2022 ,66(20) :148 -161. 
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8 3 个 示例 年 份 的 纯 图 情 领域 期 刊 组 合 和 非 纯 图 情 领 域 期 刊 组 合 的 标准 化 分 数 的 均值 


为 了 进一步 说 明 跨 学 科 性 与 新 颖 性 (或 传统 性 ) 
的 莹 异 ,参照 CSSCI 的 专业 领域 分 类 计算 了 不 同年 份 
Sua UM EI a 
jfi XH: 9596 置信 区 间 , 结 果 见 图 9。 从 图 9 可 以 看 

情 领域 的 期 刊 与 其 他 领域 的 期 刊 的 组 合 的 新 颖 
性 你 在 较 大 差异 ,而 且 随时 间 变 化 的 趋势 明显 。 相 较 
而 膏 , 新 闻 传 播 学 领域 的 期 刊 与 图 情 领域 的 期 刊 组 合 
是 局 为 “常见 ” 的 跨 界 组 合 ,标准 化 分 数 均值 几乎 为 0。 
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而 文史 哲 和 艺术 学 领域 的 期 刊 与 图 情 领 域 的 期 刊 组 合 
的 标准 化 分 数 均值 较 低 ;经 济 学 .社会 学 ,心理 学 .自然 
资源 与 环境 、 人 文 经 济 地 理 等 领域 的 期 刊 与 图 情 领 域 
的 期 刊 组 合 标准 化 分 数 均值 更 低 。 此 外 ,从 不 同年 份 
的 情况 来 看 ,这 些 领 域 的 期 刊 组 合 的 标准 化 分 数 均值 
有 较为 明显 的 差异 ,这 进一步 说 明 新 颖 性 与 蜂 学 科 性 
是 有 差异 的 。 


Ao x 
* "a 
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4T P E w^ x4 45 q* (€ x 


m 2000 年 -2019 年 均值 


m 2000 年 -2009 年 均值 


m 2010 年 -2019 年 均值 


图 9 不 同年 代 图 情 领 域 期 刊 与 各 领域 期 刊 组 合 的 
标准 化 分 数 的 均值 及 其 9$ 色 置信 区 间 
t: CDCSSCI 的 专业 类 目 并 不 严格 按照 学 科 设置 。 在 使 用 CSSCI 分 类 时 ,参考 《学 位 授予 和 人 才 培 养 学 科目 录 》 和 《中 国 图 书馆 分 类 法 》 
将 原 有 的 宗教 学 和 哲学 合并 .中 国文 学 和 外 国文 学 合并 ;@ 标 准 化 分 数值 均值 越 小 ,说 明 新 颖 性 越 强 


5.2. 我 国 图 情 领域 的 “ 守 正 创新 ” 
研究 结果 验证 了 假设 1 和 假设 2, 进 而 说 明 , 在 图 
情 领 域 的 研究 中 ,保持 传统 性 的 “ 守 正 ”、 追 求 新 蜂 性 
的 “创新 ”都 可 以 成 就 有 影响 力 的 研究 。 并 且 , 这 与 库 
恩 提出 的 科学 发 展 的 “范式 ”有 细微 区 别 。 在 库 恩 的 
论述 中 ,学 科 范 式 的 变化 是 “割裂 的 ”剧烈 的 变化 ,而 
图 情 领域 的 创新 和 发 展 是 在 传承 中 进行 的 。 根 据 回归 


分 析 结 果 ( 见 表 1) 可 以 算出 ,在 2000 年 至 2019 年 间 ， 
其 他 因素 不 变 时 ,论文 传统 性 提高 1 个 单位 ,其 成 为 高 
被 引 论文 的 优势 比 会 提高 33.86% (p <0.000 1) ;同样 
地 ,其 他 因素 不 变 时 ,论文 的 新 家 性 提高 1 个 单位 ,其 
成 为 高 被 引 论 文 的 优势 比 会 提高 11. 4896 (p < 
0.000 1) ,值得 说 明 的 是 ,对 该 结果 的 解读 务必 非常 间 
慎 。 尽 管 从 系数 本 身 来 看 ,传统 性 的 系数 大 得 多 ,但 传 
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统 性 的 均值 为 2.632, 而 最 大 值 为 3.015。 因 此 ,尽管 
其 系数 较 大 ,但 传统 性 提升 一 个 单位 是 不 太 可 能 的 。 
而 新 颖 性 的 情况 完全 相反 ,其 均值 仅 为 1. 369 277 ,而 
最 大 值 同 为 3.015 ,因而 提升 一 个 单位 是 有 可 能 的 。 所 
以 ,结合 取 值 范围 和 系数 来 看 ,新 颖 性 和 传统 性 的 影响 
其 实 差别 不 大 。 此 外 ,这 两 个 变量 提升 1 个 单位 ,实际 
上 都 是 非常 大 的 提升 了 ,以 新 颖 性 为 例 ,新 颖 性 为 
-1.5 排 在 前 8. 1896 ,而 新 颗 性 为 -0.5 却 排 在 前 
22.39% .尽管 如 此 ,这 些 结果 说 明 ,图 情 领域 的 高 被 引 
论文 都 兼 具 传统 性 和 新 颖 性 , 即 保持 相当 的 传统 性 名 
基础 上 才能 更 好 地 进行 创新 ,进而 充分 体现 了 我 国 图 
情 领域 “ 守 正 创新 ”的 特点 。 结 合 图 5 的 边际 效应 分 
析 , 可 以 进一步 了 解 图 情 领 域 论文 “ 守 正 创新 ”的 特 
点 显然, 新颖 性 高 同时 传统 性 高 的 论文 最 有 潜力 成 
为 痪 被 引 的 论文 , 比 新 颖 性 低 且 传统 性 低 的 论文 成 为 
高 被 引 论文 的 概率 高 出 近 1.25 倍 , 比 新 颖 性 高 传统 性 
人 从 论文 和 新 颖 性 低 传统 性 高 的 论文 成 为 高 被 引 论文 
的 苔 率 也 分 别提 高 44. 49% 和 53. 91% 。 这 进一步 说 
明 在 图 情 领域 中 ,在 充分 继承 学 术 传统 的 基础 上 开展 
的 创新 , 即 守 正 创新 ,更 具有 潜在 的 学 科 影响 力 ”” 。 
J 对 比 表 1 中 的 其 他 两 个 模型 可 以 看 出 ,图 情 领域 


当 具 备 的 特点 ,从 而 “有 的 放 矢 ”地 进行 创新 ,创造 性 
地 形成 了 至 今 仍 具 有 影响 力 的 分 类 法 。 

男 一 方面 ,图 情 领 域 具有 很 强 的 实践 性 , 绝 大 部 分 
研究 都 来 自 实践 或 基于 实践 。 从 实践 中 提炼 理论 或 方 
法 时 ,往往 会 形成 带 有 很 强 的 “局 部 性 ”的 特征 , 即 与 
实践 的 具体 情境 有 所 关联 ,而 更 为 深刻 的 .更 具 一 般 性 
的 理论 需要 我 们 进一步 挖掘 学 科 内 涵 , 以 实现 对 已 有 
知识 体系 的 完善 与 融合 。 例 如 ,图 书馆 学 五 要 素 理论 
是 刘 国 钩 先生 提出 的 ` 面 向 传统 环境 中 的 图 书馆 的 重 
要 理论 。 在 图 书馆 面临 " 数 智 " 环境 的 今天 ,该 理论 尽 
管 仍 具有 指导 作用 ,但 也 需要 与 时 俱 进 , 既 在 理论 上 有 
所 发 展 , 也 在 实证 研究 中 得 到 检验 ,从 而 使 该 理论 不 断 
完善 ,形成 图 书馆 学 的 重要 基础 理论 。 

从 “创新 "来 看 ,图 情 领 域 的 创新 必须 紧密 围绕 本 
领域 关切 的 核心 议题 展开 。 不 同学 科 或 领域 的 知识 方 
法 或 者 不 断 发 展 的 信息 技术 都 为 图 情 领域 的 创新 提供 
了 丰 沃 的 土壤 ,但 必须 将 这 些 “ 新 "内 容 ,根植 于 图 情 
的 核心 议题 之 中 ,思考 新 知识 、 新 技术 、 新 方法 等 对 于 
图 情 领 域 的 核心 研究 议题 的 价值 和 贡献 ,选择 更 具有 
切 题 性 的 突破 口 来 结合 “新 ”内 容 , 才 有 可 能 实现 有 影 
响 力 的 创新 ,从 而 为 图 情 领域 的 发 展 做 贡献 。 换 言 之 ， 
应 当 从 本 学 科 领 域 发 展 的 需要 来 学 习 和 吸收 其 他 领域 


新 颖 性 的 作用 在 减弱 ,而 传统 性 的 作用 在 加 强 。 从 基 
而 含义 上 说 ,这 可 能 是 由 近年 来 信息 技术 的 迅速 发 展 
和 忆 速 迭代 而 导致 的 。 图 情 领域 的 诸多 研究 高 度 关注 
售 区 技术 的 新 发 展 ,然而 在 研究 新 技术 的 同时 ,还 没 能 
将 用 技术 与 图 情 领域 的 核心 问题 紧密 融合 ,形成 新 的 
核 恋 研 究 问题 。 尽 管 如 此 ,这 种 趋势 还 是 说 明 图 情 领 
域 后 高 被 引 论文 通常 是 在 充分 利用 本 学 科 已 有 知识 之 
上 的 传承 和 发 展 ,并 且 , 注 重 学 科 传承 的 趋势 逐渐 加 
强 。 从 另 一 个 角度 来 看 ,这 也 说 明 图 情 领域 对 学 术 伟 
承 的 “坚守 ”的 重视 , 即 需 要 先 “ 守 正 " 才 能 后 “创新 ”， 
并 且 这 种 “ 守 正 "并 非 因 循 守旧 ,而 是 以 寻求 创新 为 导 
dg", 

研究 结果 对 如 何在 图 情 领域 “ 守 正 创新 "具有 启 
示 作用 。 从 “ 守 正 "来 看 ,一 方面 ,图 情 领域 对 学 术 传 
承 的 重视 启示 我 们 应 当 进 一 步 总 结 、 回 顾 和 反思 已 有 
的 理论 和 方法 。 对 已 有 研究 成 果 不 断 提炼 发展 和 完 
善 才 能 形成 一 般 性 的 综合 的 .开创 性 的 新 理论 .新 方 
法 。 例 如 , 刘 国 钧 先生 在 论述 建立 统一 的 ,符合 我 国 发 
展 需要 的 图 书 分 类 法 时 ,首先 系统 地 梳理 了 我 国 图 书 
分 类 法 的 发 展 , 然 后 深度 剖析 了 众所周知 的 史 志 目 录 、 
杜威 法 和 当时 正在 使 用 的 一 系列 分 类 法 的 基本 情况 和 
不 足 之 处 ,进而 说 明 新 的 分 类 法 应 当 解 决 的 问题 和 应 


成 熟 的 理论 体系 和 研究 方法 ,进而 实现 突破 和 创新 。 
此 外 ,结合 图 8 和 图 9 可 以 发 现 , 未 来 图 情 领域 的 “ 守 
正 创 新 ” ,可 以 更 多 地 考虑 与 一 些 以 往 关注 较 少 的 领域 
进行 碰撞 和 融合 ,如 经 济 学 .社会 学 ,心理 学 .自然 资源 
与 环境 、 人 文 经 济 地 理 等 ,从 个 体 、 群 体 、 社 会 .外 部 自 
然 币 人 文 环境 等 视角 进一步 探索 图 情 领域 关注 的 现 
2 ,发展 和 完善 图 情 领域 已 有 的 规律 。 

从 图 6 中 可 以 发 现 , 在 图 情 领域 ,团队 合作 不 仅 有 
助 于 提高 研究 成 果 的 新 颖 性 ,还 有 助 于 将 研究 成 果 的 
传统 性 保持 在 较 高 水 平 。 换 言 之 ,从 学 科 创 新 的 微观 
机 制 而 言 ,团队 作者 在 图 情 领 域 “ 守 正 创新 ”的 过 程 中 
起 着 重要 作用 ,并 且 其 重要 性 随时 间 变 迁 在 不 断 加 强 ， 
团队 作者 对 新 颖 性 的 影响 越 来 越 强 于 双人 作者 的 影 
响 。 这 充分 说 明 ,依靠 研究 团队 更 容易 实现 图 情 领域 
的 守 正 创新 。 然 而 ,与 十 几 年 前 的 情况 类 似 " LB 
前 图 情 领域 论文 合作 依然 是 以 2 -3 人 的 小 团队 合作 
为 主 ( 占 到 了 作者 人 数 规模 的 43.96% ) ,3 人 及 以 上 的 
仅 占 6.24% 。 这 说 明 ,一 方面 ,图 情 领域 的 研究 者 还 
未 充分 认识 到 或 尚未 充分 挖掘 研究 团队 在 学 科 守 正 创 
新 中 的 作用 。 另 一 方面 ,这 也 可 能 与 图 情 领域 的 学 科 
制度 有 所 关联 。 目 前 ,图 情 领域 的 院 校 在 招聘 或 职称 
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生 的 分 析 [J]. 图 书 情报 工作 ,2022 ,66(20) :148 -161. 


评定 环节 认定 申请 者 的 研究 成 果 时 ,往往 要 求 申 请 者 
所 提交 的 论文 是 其 以 第 一 作者 或 通讯 作者 完成 的 。 这 
为 多 人 团队 合作 带 来 了 制度 障碍 ,如 何 突破 这 种 规则 
的 檬 格 , 释 放 研究 团队 在 学 科 创 新 中 的 潜力 ,也 是 图 情 
领域 未 来 需要 研究 解决 的 重要 问题 之 一 。 


6 结语 


本 文通 过 一 种 优化 后 的 基于 MCMC 的 方法 对 我 
2000 年 至 2019 年 20 年 间 在 中 文 社 会 科学 引文 索 
3| (CSSCI) 中 收录 的 图 书馆 学 情报 学 领域 的 70 207 篇 
研究 论文 的 新 颖 性 .传统 性 进行 了 测量 ;通过 回归 分 
析 , 验 证 了 论文 新 颖 性 和 传统 性 对 本 领域 论文 学 科 影 
响 力 的 作用 ,分 析 结 果 具 有 很 好 的 统计 稳健 性 。 这 些 
研究 结果 充分 说 明了 我 国 图 情 领域 守 正 创新 的 特点 ， 
并 末 如 何在 图 情 领域 守 正 创新 具有 启示 作用 ,也 为 理 
解 我 国 图 情 领 域 学 术 创新 规律 提供 了 有 力 的 实证 


加 尽管 本 文 的 重点 在 于 探索 图 情 领域 的 守 正 创新 的 
规律 ,但 在 研究 方法 上 也 有 所 贡献 。 本 文 是 国内 图 情 
领域 中 最 先 使 用 MCMC 方法 的 研究 。 从 统计 上 看 ， 
MENC 方法 与 以 往 信息 计量 研究 中 使 用 的 方法 有 着 本 
质 因 别 。 以 往 信息 计量 研究 中 使 用 的 方法 属于 统计 中 
的 岗 率 学 派 ,其 基本 思路 是 :通过 大 量 的 经 验 研 究 ,得 
到 普 于 引文 分 布 的 参数 的 统计 特征 ,进而 假定 其 总 体 
仿 所 ,然后 进行 统计 推 灯 。 例 如 ,引文 宕 律 分 布 是 信息 
计时 中 的 基本 定理 。 因 此 ,不 少 研究 都 希望 通过 发 现 
现实 引文 网 络 的 志 律 分 布 特性 来 检验 这 一 定理 。 从 整 
Vos E. 引文 军 律 分 布 得 到 了 不 同 程度 的 验 
证 9, 基本 上 呈现 出 不 同 领域 引文 者 律 分 布 具体 
参数 有 所 区 别 , 但 存在 共性 ,同时 也 存在 一 些 宕 律 
分 布 不 完全 成 立 的 情况 5 。 即 使 假定 寡 律 分 布 是 恒 
成 立 的 ,在 研究 实际 中 ,能 使 用 的 数据 往往 是 在 不 定 领 
域 ,特定 主题 或 特定 年 份 等 一 系列 条 件 下 收集 的 。 这 
些 限制 条 件 下 得 到 的 数据 ,难以 满足 大 数 定律 ,因而 从 
数据 得 到 的 引文 分 布 未 必 都 服从 或 近似 服从 宕 律 分 
布 ,或 者 这 些 数据 来 自 多 个 领域 ,进而 出 现 多 个 者 律 分 
布 的 联合 分 布 的 情况 。 无 论 哪 种 情况 ,都 会 导致 现实 
研究 中 出 现 复杂 统计 分 布 统计 推断 的 问题 。 此 时 的 似 
然 函数 过 于 复杂 ,难以 进行 最 大 似 然 估计 。 而 面 对 这 
些 问题 应 当 如 何 开展 有 效 的 信息 计量 分 析 , 还 缺乏 相 
对 系统 深入 的 研究 。 

本 文采 用 的 MCMC 是 一 种 基于 贝 叶 斯 学 派 的 统 
计 方 法 ,是 可 以 有 效 解决 上 述 问题 的 一 种 方法 。 与 频 


率 学 派 不 同 , 贝 叶 斯 学 派 的 方法 无 需 假定 总 体 分 布 的 
似 然 函数 ,而 是 利用 贝 叶 斯 的 统计 推断 方法 (如 MC- 
MC) ,以 经 验 分 布 为 后 验 分 布 来 解决 一 些 最 大 似 然 估 
计 难 以 操作 的 问题 。 例 如 ,在 本 文中 ,无 需 事 先知 晓 
2000 -2019 年 CSSCI 收录 的 我 国 图 情 领域 研究 论文 的 
引文 服从 何 种 ( 窜 律 ) 分 布 及 其 似 然 函 数 的 形式 ,可 以 
通过 MCMC 的 方法 从 观测 到 的 引文 关系 中 构造 出 与 
之 近似 甚至 几乎 相同 的 后 验 分 布 ,并 进行 相关 参数 估 
十 ,或 进行 模拟 ,通过 模拟 值 与 观测 值 的 比较 来 进行 统 
计 推 新 。 这 种 方法 更 适合 引文 分 布 较为 复杂 、 其 对 应 
的 似 然 函 数 不 便 计算 的 和 情况。 实际 上 , 贝 叶 斯 统计 的 
方法 在 样本 量 相 较 总 体 较 小 或 不 确定 较 强 的 情形 下 ， 
往往 能 有 更 好 的 统计 效力 ,也 能 完成 一 些 传 统 频率 学 
派 的 方法 所 不 能 实现 的 统计 推断 。 因 此 , 它 有 效 地 补 
充 了 传统 信息 计量 的 方法 ,并 极 大 地 丰富 了 信息 计量 
的 方法 。 
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e Abstract: | Purpose/Significance | With papers in the field of library and information science in China, this 
"study measures the novelty and conventionality of these papers and explores their effects on the scientific impacts of 
Chhese papers, in order to reveal the law of scientific innovation in this field. | Method/Process | This paper adopted 
Ca variation of the Markov Chain Monte Carlo (MCMC) approach to measuring novelty and conventionality of 70 207 
(papers in library and information science (n 270 207) from the Chinese Social Science Citation Index ( CSSCI) in 
luo decades , specifically, from 2000 to 2019. With robust logistic regression, this paper examined the impacts of pa- 
tpers' novelty and conventionality on their papers? scientific impacts. | Result/Conclusion | The results show that, 
ceteris paribus, the novelty of a paper increases by 1 unit, the odds ratio of the paper becoming a highly cited paper 
 Óncreases by 11% (p «0.000 1) , and the conventionality of a paper increases by 1 unit, and the odds ratio of the 
ber becoming a highly cited paper increases by 3396. (p «0.000 1). The marginal effect analysis shows that pa- 
9. with high novelty and conventionality are more likely to be highly cited papers than other types of papers. In ad- 
dition, over time, the impact of novelty on the probability of a paper being highly cited gradually weakens, while the 
impact of conventionality gradually increases. Meanwhile, author team size has a significant effect on the novelty of 
the paper, and such a effect increases over time. These findings highlight the characteristics of scientific innovation 
in the field of library and information in China, and provide novel empirical evidence to understand the law of scien- 
tific innovation in the field of library and information in China. Last but not least, this paper, based on Bayesian sta- 
tistics, also proposes an alternative method for informetrics. 
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